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空气 质量 预测 的 深度 学 习 模 型 研究 与 实践 


黎 嘉 明 
(广东 省 生态 环境 监测 中 心 ,广东 广州 510000) 


摘要 : 


[目的 ] 及 时 和 准确 的 空气 质量 预测 数据 对 于 环境 管理 至 关 重 要 ,尤其 是 在 空气 重 污染 期 间 ， 
预测 数据 可 以 为 政府 生态 环境 管理 部 门 应 对 污染 状况 、 精 准 地 调配 社会 资源 的 决策 提供 数据 
支撑 。 
[方法 ] 笔者 研发 的 基于 深度 学 习 的 空气 质量 预测 模型 ArNet6， 可 以 兼顾 准确 性 和 实时 性 ， 
实现 贞 氧 、 二 氧化 硫 、 一 氧化 碳 等 因子 的 7 天 甚至 更 长 时 间 的 空气 质量 预测 。 
[结果 ] 与 传统 的 化 学 模型 演算 不 同 ， 本 模型 使 用 时 空 图 卷 积 网 络 (STGCN) ， 能 捕获 历 
监测 数据 、 天 气 预 测 数 据 、 社 会 活动 等 数据 的 规律 ， 在 2 分 钟 内 完成 一 百 多 个 点 位 未 来 168 
小 时 数据 的 预测 。 
[结论 ] 实验 表明 ，AirNet6 模型 在 速度 、 节 能 和 准确 度 上 ， 比 传统 的 化 学 模型 及 时 间 序 列 
AI 模型 均 有 明显 进步 。 
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Research and Practice of Deep Learning Model for Air Quality 


Prediction 
Li JiaMing 
(Guangdong Eco-environment Monitoting Center, Guangzhou 510000, China) 
Abstract: 


[Objective] Timely and accurate ait quality prediction data is very important for envitonmental 
management, especially during the period of heavy air pollution. The prediction data can provide data 
suppott fot the decision-making of the govetnment's ecological envitonment management 


departments to cope with the pollution situation and accurately allocate social resoutces. 


[Methods] The air quality prediction model AirNet6 developed by the author based on depth 
learning can give considetation to both accuracy and real-time performance to achieve 7-day or longer 


aif quality prediction for ozone, sulfur dioxide, catbon monoxide and othet factots， 


[Results] Unlike traditional chemical model calculations, this model base on Spatio-Temporal 
Graph Convolutional Netwotks (STGCN), which captutes the laws of histotical monitoring data, 
weather prediction data, social activities and other data, and completes the prediction of mote than 


one hundred boints for the next 168 houts in two minutes. 
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[Conclusions] Experiments show that the AirNet6 model has made significant progress in speed, 


energy efficiency, and accuracy compated to traditional chemical models and time seties AI models. 


Keywords: Air quality prediction; attificial intelligence; depth learning model; STGCN 


引言 


传统 的 基本 


化 学 模型 的 空气 质量 预测 方法 ， 


通过 复杂 的 模拟 运算 得 到 结果 
计算 资源 , 并 耗 时 数 个 小 时 才能 生成 结果 
量 预测 的 数据 对 环境 管理 很 重要 ， 是 政府 做 出 决策 、 调 配 资 源 、 


般 是 基于 


污染 源 排放 数据 、 天 气 预测 数据 


,庞大 的 计算 量 需 要 用 到 大 规模 服务 器 集群 甚至 超级 计算 机 等 


在 地 方 唱 遇 到 重 污染 天 气 时 ,管理 机 构 和 专家 需要 实时 
一 天 就 有 几 次 会 商量 对 策 , 这 就 需要 更 力 


模型 的 计算 速度 就 很 难 满足 需求 。 
而 随 着 人 工 管 能 技术 的 发 展 ， 常 用 的 时 间 序 列 预测 模型 如 


以 根据 历史 的 监测 数据 ， 比 如 前 一 小 时 的 数 


因此 通常 只 能 做 到 只 能 每 天 预测 一 次 。 而 空气 质 


采取 应 对 措施 的 基本 依据 


RNN、 


点 对 天 气 和 污染 状况 作出 诀 策 , 往往 
上 及 时 反映 当前 时 刻 状况 的 预测 数据 , 这 个 时 候 化 学 


LSTM、Prophet 都 可 


内 完成 , 满足 实时 预测 结果 的 需要 。 但 时 间 序 列 的 模型 只 是 单纯 地 捕捉 测 点 的 数据 随时 间 变 


化 的 规律 , 并 没有 考虑 测 点 之 间 的 关联 因素 , 也 没 


为 了 同时 提高 ; 
Convolutional Networks, STGCN) 在 
质量 数据 以 及 它们 的 空间 关联 


住 确 度 和 计算 速度 ， 笔 者 基 汪 


发 了 新 的 深度 


学 习 模 型 , 不 


居 ， 推 测 出 后 续 的 数据 变化 ,并 且 可 以 在 短 时 间 
有 关联 天 气 的 因素 , 因此 准确 度 仍 有 不 足 。 


时 空 图 卷 积 网 络 (Spatio-Temporal Graph 
只 是 利用 了 测 点 的 历史 空气 


， 还 加 入 了 相应 的 天 气 预 测 数 据 、 社 会 活动 数据 等 影响 空气 质 


量 的 因素 ， 人 快速 预测 出 168 小 时 内 的 空气 质量 数据 。STGCN 最 早 是 用 于 交通 网 络 的 流量 预 
测 〈 Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic 


Forecasting，2018) ， 它 


时 间 卷 积 层 和 空间 卷 积 层 ， 各 自用 于 捕捉 节点 数据 的 


1. 模型 设计 


臭氧 
> | 天 气 预测 


人 类 活动 


输入 引 


若干 个 时 空 


长 最 


二 


时 间 


(天 气 和 活动 可 预测 ， 故 更 多 ) 


积 块 和 一 个 连接 层 组 成 ， 其 中 一 个 卷 积 块 中 包含 了 
时 间 特 征 和 空间 特征 。 
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1.1 模型 输入 


一 小 


同 的 


由 


少 ， 


其 中 , 天 气 
例如 ， 当 需要 预测 
测 数据 以 及 社会 活动 数据 , 而 不 是 只 


另外 , 空气 质量 数据 是 基 了 


此 外 ， 


图 1 所 示 ， 模 型 输入 的 数据 是 
时 ， 例 如 以 一 年 的 数据 作为 输入 ， 
如 广东 的 国 控 空 气 监测 的 点 位 有 125 个 ， 点 位 维度 的 长 度 就 
因子， 其 中 第 一 个 通道 
道 是 天 气 预 测 的 数据 ， 


通道 是 入 


二 会 活动 数据 。 


图 1 模型 数据 流 图 


Figl. Model Data Flow Diagram 


分 别 是 气 


一 个 3 维 张 量 (tensor) ， 其 中 第 一 
为 365*24=8760。 第 二 维 
为 125。 


时 间 维 度 


气 预测 数据 与 社会 活动 数据 是 可 预测 的 ， 


7 天 后 空 


经 1 


间 域 统一 。 


究 测 试 ， 


因此 ， 


一 个 数据 。 为 了 可 


的 长 度 


量度 > 


湿度 、 


第 三 


维 是 时 间 ， 粒 度 为 


是 点 位 ， 例 


维 是 通道 ， 对 应 不 


u 风速 


束 、v 风速 


因此 它们 的 数据 比 历史 监 


ee 例如 ozone 的 监测 数据 ， 第 二 个 通道 开始 的 7 个 通 
压 、 光 照 、 降 水 、 温 


最 后 一 个 


监测 数据 多 一 


仿 确 、 完 整地 收集 ， 


并 


合 


。 因 此 ， 


频繁 程度 


种 排列 ， 通过 对 历史 数据 这 8 种 情况 的 监测 数据 统计 ， 
24 小 时 中 的 平均 值 ， 


value 


» 


笔者 使 用 一 个 宏观 的 统计 值 作为 入 
主要 与 “工作 


日 (w) ”及 


“后 一 日 ”不 同情 况 的 枚 举 ，f 


作为 代表 其 宰 


m= WWW 219days 
m= WWr 76days 
m= WrW 8days 
ms Wir 69days 


m= rWW 77days 
mm rWr Odays 
ma rrW 69days 
m= rrr 28days 


笔者 使 用 监测 点 位 作为 统一 的 空 


民 据 其 位 置 通过 插值 得 出 。 


zs 间 域 ,数据 


“休息 日 (7) 


染 源 排放 、 


guoKong 24 houi 


4 6 8 10 12 


图 2 在 8 类 


hour 


14 


让 


经 济 活 动 、 交 通 流量 等 微观 数据 很 难 
昌 它 们 的 时 间 与 空间 域 跟 监 测 数 据 相 差 很 远 , 难以 像 气 象 数 据 那 样 整 


气质 量 数据 时 ， 模 型 可 以 使 用 已 经 获取 到 的 7 天 后 的 天 气 预 
只 使 用 当前 的 历史 数据 ,这 样 可 以 令 预测 的 结 细 


更 为 准确 。 


监测 点 位 的 数据 ， 而 天 气 预测 数据 是 网 格 数据 ,例如 本 模型 
使 用 的 NOAA (National Oceanic and Atmosphetic Administration) 的 GFS (The Global Forecast 
System) 数据 ， 是 沿 经 纬度 每 0.25 度 
需要 把 他 们 的 空 
每 个 监测 点 位 的 天 气 预测 数据 ， 直 


社会 活动 数据 如 污染 


以 将 这 两 种 数据 融入 到 一 个 模型 中 ， 
量 可 以 大 为 减 


F 会 活动 量 的 可 以 预测 的 
”的 交替 相关 ， 
导出 www、wwtf、wtw、Wwtt、tww、twt、trtrw、ttr 这 8 
就 可 以 得 出 每 个 点 位 在 这 8 中 情况 下 


会 活动 频繁 程度 的 经 验 值 ， 如 图 2 所 示 : 


标 。 


通过 对 


工作 日 情况 下 的 监测 数据 均值 


Fig2. Mean monitoring data under 8 kinds of working day 


3 


“前 


用 


于 社会 活动 的 


2 
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1.2 网 络 结构 


模型 的 网 络 结构 如 图 3 所 示 , 模型 的 网 络 结构 由 三 层 时 空 卷 积 块 和 一 层 连 接 层 组 成 , 其 


中 连接 层 有 4 个 连接 块 , 为 了 同时 输出 4 个 时 间 点 的 预测 数据 。 时 空 卷 积 层 中 ,第 三 层 的 时 


空 卷 积 层 与 连接 层 对 接 ， 也 是 4 个 卷 积 块 , 分 别 对 接 到 4 个 连接 块 , 而 前 两 层 的 时 空 卷 积 层 


只 有 统一 的 卷 积 块 。 


图 3 模型 的 网 络 结构 图 


Fig3. Network sttuctute diagtam of the model 


1.3 模型 输出 


最 初 的 模型 输出 的 数据 是 一 个 1 维 张 量 , 第 一 维 是 点 位 , 数据 代表 这 些 点 位 在 n 个 小 时 
候 后 的 时 间 反 的 空气 质量 。 这 就 需要 为 每 一 个 时 间 点 训练 一 个 模型 , 如 果 需 要 预测 7 天 的 空 
气质 量 数 据 ， 就 要 训练 7+24=168 个 模型 ， 而 6 个 监测 因子 的 话 ， 就 要 训练 168*6=1008 个 模 


型 。 


经 研究 迭代 , 使 用 时 间 移 位 的 方法 , 每 个 因子 只 需要 训 


练 8 个 模型 。 方 法 是 每 个 模型 只 


预测 n=[3,6,12,24,48,72,120,168]8 个 时 间 点 的 空气 数据 ， 这 样 就 只 需要 8*6=48 个 模型 。 而 这 


些 时 间 上 反之 间 的 数据 , 使 用 最 靠近 的 后 面 的 时 间 扣 模型 计算 得 出 , 但 输入 数据 需要 相应 前 移 
获取 。 例如， 时 间 点 10 没有 对 应 的 模型 ， 就 是 用 后 面 最 靠近 的 12 的 模型 ， 但 输入 数据 需要 


前 移 2 小 时 来 取 。 


如 图 4 所 示 ， 假 设 时 间 反 12 的 模型 需要 输入 24 个 小 时 的 数据 ， 当 前 时 刻 为 tf t 以 及 + 
以 前 的 数据 都 已 就 绪 ; 而 预测 tt7~t+12 的 数据 ,都 使 用 时 间 点 12 的 模型 计算 ,其 中 预测 t+12 
时 ， 输 入 £23~t 的 数据 ;预测 tt10 时 ， 输 入 t-25~t-2 的 数据 。 
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Input 
[40 [30 [20 [10 


页 


4 模型 数据 和 输入 输出 映射 图 
Fig4. Model data input output mapping diagram 


同 理 ， 时 间 点 an 的 模型 可 和 窗 盖 的 预测 时 间 ， 如 表 1 所 示 : 


表 1 时 间 点 窗 盖 表 


‘Table 1.Time point coverage 


时 间 点 4 模型 ” 窗 盖 预测 时 间 


3 1h~3h 
0 4h~6h 
12 7h~12h 
24 13h~24h 
48 25h~48h 
72 49h~72h 
120 73h~120h 
168 121h~168h 


经 进一步 的 研究 迭代 ， 将 模型 结构 改 为 多 输出 (如 图 3 所 示 ) ， 每 个 因子 只 需要 训练 3 
个 模型 ， 其 中 一 个 用 于 同时 预测 n=[3,6,12,24]4 个 时 间 点 后 的 空气 数据 ， 一 个 同时 预测 
n=[48,72] 两 个 个 时 间 点 ， 还 有 一 个 同时 预测 n=[120,168] 两 个 时 间 点 ， 这 样 就 只 需要 3*6=18 
个 模型 。 经 测试 对 比 ， 将 时 间 点 作 4-2-2 的 分 割 可 以 减少 模型 和 训练 模型 的 时 间 ， 而 且 准 确 
率 几 乎 没有 下 降 。 但 若 作 4-4 分 制 ， 后 面 4 个 时 间 点 〈48,72,120,168) 的 准确 率 有 些 下 降 ， 
如 果 是 用 1 个 模型 直接 输出 8 给 时 间 点 ， 准 确 率 更 加 会 显著 下 降 ， 因 此 4-2-2 的 分 割 是 相对 
更 好 的 选择 。 


最 后 ， 和 迭代 后 模型 的 输出 ， 为 一 个 2 维 张 量 ， 第 一 维 是 时 间 点 ， 长 度 为 2 或 者 4， 代 3 
2 或 者 4 个 时 间 点 ， 第 二 维度 是 点 位 。 
2， 实 验 


2.1 数据 集 
笔者 使 用 了 广东 省 125 个 国 控 点 的 空气 质量 小 时 数据 作为 训练 和 验证 模型 的 数据 , 包括 
氧 、 二 氧化 乞 、 一 氧化 碳 、 二 氧化 硫 、PM10、PM2.5 六 个 监测 因子 ， 点 位 的 经 纬度 坐标 


KT 


5 
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用 于 与 天气 


GFS 的 历史 数 


OPeNDAP。 


如 前 文 所 述 ,入 
模块 和 chinese_calendat 模块 获取 
数据 集 的 范 
日 ) 的 数 


7 月 1 


而 天 气 了 
和 矩形 ("north": 


据 测 的 数据 笔者 


预测 数据 关联 插值 。 
使 用 NOAA 的 GFS0.25 数据 ， 空 间 范 围 是 窗 盖 广东 省 的 经 纬度 
26,"west": 109,"south": 20,"east": 118) 。 其 中 ， 用 于 常规 运行 的 实时 GFS 天 气 
预测 数据 可 从 NOMADS (NOAA Operational Model Archive and Disttibution System) 获取 , 而 


围 为 2021 年 4 


季度 的 数据 用 于 计 


2.2 数据 预 处 理 


据 用 于 训练 ，2022 年 7 


练 ，1 个 季度 


时 在 NOAA 的 网 站 上 只 保留 8 天 ， 
UCAR (University Cotpotation for Atmosphetic Reseatch ) 


LF 会 活动 数据 使 用 “工作 日 -休息 日 ” 


段 日 数据 ， 


月 1 日 到 2022 年 10 


月 1 日 


输入 空 数据 ， 
周边 有 数据 的 点 位 的 数据 ， 通过 克 
情况 一 般 为 网 络 或 才 


仍 有 缺 数据 


所 上 


习 控 点 的 空气 质量 监测 


页 
这 
于 
党 
湾 
殉 

4 

二 


1 日 , 其 中 2021 年 4 


至 2022 年 10 月 1 


的 数据 用 于 测试 。 


(这 


天 气 预 测 数 于 
前 几 天 都 会 预 
社会 活动 
对 于 所 有 日 
比例 压缩 到 [0,1] 的 范围 ， 以 利 拉 
训练 的 历史 数 于 


宏观 提 


下 限 值 扩展 


倍 。 


输入 数 


缺失 不 常见 ， 而 晶 
则 到 ) ， 只 需要 把 前 一 天 和 后 一 天 相应 时 间 的 数据 赋值 过 来 即 可 。 


外 标 数据 没有 缺失 ， 不 需要 补足 。 
据 , 在 进入 模型 之 前 , 规格 化 都 是 必须 的 ,规格 化 训 


Ee 


中 心服 务 故障 ， 导 致 同 
据 ) ， 此 时 使 用 时 间 补 足 ， 用 这 个 点 位 前 一 天 的 数据 补足 缺失 的 数据 。 


设 Saax、 Suin、 


化 的 上 限 和 下 限 使 用 以 下 公式 : 


2.3 实验 设置 


笔者 使 用 3 台 PC 进行 训练 及 验 训 


ubuntu20.04 和 python3.9 环境 中 ，AI 框架 使 用 pytouch1.12.0，CUDA 版 本 为 11.7， 并 
加 快 计算 速度 和 减少 GPU 内 存 使 用 ， 模 型 


2.4 实验 结果 
根据 《环境 空气 质量 数值 预报 技术 规范 


预报 统计 评介 


Normalized.,.=2 X SnasSavg 


Normalized,,=2 xX Snis- Sasg 


Swe 分 别 是 所 有 样本 数据 的 最 大 值 、 最 小 值 和 


因为 天 气 


经 网 络 计算 。 
居 ) 的 最 大 最 小 值 , 但 为 了 训练 


因此 历史 的 天 气 预测 数据 获取 的 渠道 是 
， 两 个 渠道 使 用 的 接口 均 为 


) 日 常 存在 缺 数据 的 现象 , 而 模型 不 能 
需要 先 把 缺失 的 数据 补足 。 补 足 的 方法 是 先 用 空间 补足 ， 即使 用 同一 时 间 

里 金 插 值 的 方法 得 出 缺 数 据 皮 位 的 数值 。 如 果 空 间 补 足 后 
时 间 大 部 分 点 位 都 没有 数 


宏观 经 验 值 , 笔者 使 用 python holidays 
加 上 空气 质量 历史 统计 数据 组 成 。 

有 月 1 日 至 2022 年 
日 的 数据 用 于 测试 。 即 5 个 


预测 数据 元 余 非常 多 〈 一 个 时 间 点 的 数据 ,之 


规格 化 的 上 下 限 值 一 般 设置 为 样本 数 


i 是 把 所 有 数值 按 


局 《 供 


的 模型 能 够 适应 样本 以 外 的 数据 , 笔者 将 上 


平均 值 ， 


果 与 实况 的 


局 差 、 误 差 和 相关 性 ， 实 验 结 呈 


(1) 标准 化 平均 偏差 


5” ， 计 算 4 个 模型 在 预测 2022 年 7 


FE, 每 天 PC 


全 程 使 用 float32 类 型 进行 运算 。 


规格 


名 备 一 个 nvidia 3080 或 3090GPU 以 提供 算 
力 ， 在 训练 时 功 耗 约 为 300w， 每 个 模型 的 训练 时 间 大 概 需要 2 小 时 。 模 型 程序 运行 在 


Et 
为 


(HJ 1130-2020) >》 中 的 “6.2 单项 污染 物 浓度 


日 1 日 至 2022 年 10 


月 1 


尼 如 下 : 


(Normalized Mean Bias, NMB) 


6 


日 各 因子 预报 结 


表 2 标 ? 


人 化 平均 信 


E43 -上 
i 差 结 


比较 


‘Table 2. Compatison of standardized mean deviation results 


因子 模型 Dayl Day2 Day3 Day4 Day5 Day6 Day7 平均 
O3 
AirNet6 -0% -11% -9% -13% -13% -13% -13% -11% 
Prophet -18% -1l8% -17% -17% -18% -18% -19% -1 8% 
lstm -22%0 -24% -23% -23%0 -23% -23% -24% -23% 
~ 上 
化 3 模 50 5 65% TN% 1% 7T% 66% 65% 
型 
有 A FE 
化 池村 -9% -5% 0% 4% 5% 5% 1% 0% 
型 ( 修 偏 ) 
NO 2 
AirNet6 0% 1% 3% 0% -1% 2% 2% 1% 
Prophet -14% -14% -15% -15% -16% -16% -16% -1 5% 
lstm 22% 21% 21% 21% 20% 20% 20% 21% 
i ~ FE 
化 学 桩 49% 559%0 55% 53% 55% 50% 48% 52% 
型 
~ FE 
化 池村 -2% 2% 2% 1% 2% -1% -3% 0% 
型 ( 修 偏 ) 
CO 
AirNet6 -09%0 -8% -0%o -4% -4% -2% -2% -4% 
Prophet -8% -8% -8%0 -8% -8% -8% -8% -8% 
lstm 35% 37% 36% 309%0 36% 35% 35% 36% 
~ FE 
he 化 池村 -47%0 -47% -47/% -46% -45% -45% -47% -46% 
型 
A FE 
化 池村 -1% -2% -1% 1% 3% 1% -1% 0% 
型 ( 修 偏 ) 
SO2 
AirNet6 -9% -13% -12% -13% -13% -12% -13% -12% 
Prophet -9% -10% -10% -10% -10% -10% -10% -10% 
lstm 9% 10% 9% 9% 9% 9% 9% 9% 
本 上 
化 学 从 7% 10% 14% 17% 18% 13% 9% 13% 
型 
A FE 
化 池村 -59%0 -2% 2% 4% 5% 0% -2% 0% 
型 ( 修 偏 ) 
PM 10 
AirNet6 -4% -5% -8%0 -7% -7% -9% -9% -7% 
Prophet -23% -23% -23% -23%0 -24% -24% -24% -23% 
lstm -13%。 -13% -13% -13% -13% -12% -13% -13% 
化 学 模 -43% -43% -42% -40% -41% -42% -40% -42% 


型 


人 上 
化 学 模 -2% 
型 ( 修 偏 ) 
PM 2.5 
AirNet6 -10% 
Prophet -29% 
lstm -13% 
化 学 模 
_DO0 
型 29% 
这 梢 
化 学 -1% 
型 ( 修 信 
于 化 学 模型 
“化 学 模型 ( 修 偏 ) ”数据 


-1% 


-23% 
-29% 
-13% 


-29%0 


-2% 


局 差 较 大 ， 对 其 数 | 


做 初步 的 修 


-1% 4% 


-13% -18% 
-29% -29% 
-13% -13% 


-29% -24% 


-1% 60% 


高 处 


-7% 


-17% 
-30% 
-16% 


-33% 


-7% 


2% -1% 
-17% -17% 
-30% -30% 
-14% -15% 
-25% -27% 

3% 1% 
里 ( 除 以 (1+ 


(2) 均 方 根 误差 (Root Mean Square Error, RMSE) 


表 3 均 方 根 误差 结 


‘Table 3. Compatison of root mean squate errotr results 


比较 


-1% 


-10%0 
-30% 
-14% 


-28%0 


0% 


局 差 )) 的 处 理 后 ,得 


因子 模型 Dayl Day2 Day3 Day4 Day5 Day6 Day7 平均 
O3 
AirNet6 33.55 30.37 35.32 38.65 38.78 38.96 39.01 37.23 
Prophet 42.80 44.57 45.59 40.50 47.22 47.74 48.19 40.09 
lstm 51.79 53.06 52.97 52.71 52.91 52.97 53.04 52.78 
化 学 上 
化 学 模 55.19 56.14 60.57 063.84 65.01 64.36 63.73 01.20 
型 
化 学 上 HH 
1 学 亿 43.78 42.79 43.63 43.91 43.35 43.45 45.31 43.75 
型 ( 修 偏 ) 
NO 2 
AirNet6 9.45 9.76 10.02 9.94 9.95 10.22 10.21 9.94 
Prophet 10.66 10.79 10.86 10.92 10.98 11.06 11.13 10.91 
lstm 18.90 14.93 14.94 14.92 14.91 14.91 14.93 15.49 
化 学 上 
24.48 25.10 25.89 25.44 25.04 24.62 24.79 25.14 
= 
mA 上 
化 学 模 16.44 16.73 17.28 17.05 17.09 10.55 16.79 16.85 
型 ( 修 偏 ) 
CO 
AitNetg 037 040 040 038 037 037 037 0.38 
Prophet 0.37 0.37 0.37 0.37 0.37 0.37 0.37 0.37 
lstm 0.49 0.50 0.49 0.49 0.49 0.49 0.49 0.49 
~ FE 
化 学 模 0.47 0.48 0.48 0.48 0.47 0.45 0.47 0.47 
型 
化 学 上 HH 
1 学 全 0.50 0.50 0.51 0.51 0.51 0.48 0.49 0.50 
型 ( 修 偏 ) 


AirNet6 1471 1498 1492 1499 1490 1471 14.69 14.84 
Prophet 1471 1495 1491 1491 1482 1471 14.70 14.82 
Tt 1537 1531 1526 1525 15.15 15.03 15.00 15.20 
mA 上 HE 
人 16.09 
型 
mA 上 HE 
化 9 异 80 16860 信 的 本 好 二 罗 信物 个 析 15.67 
型 ( 修 偏 ) 
PM 10 
AirNet6 1532 1672 1670 1838 18.43 17.58 17.60 17.25 
Prophet 19.87 20.70 21.17 21.58 21.88 22.15 22.46 21.40 
ee 21.96 2226 2241 2244 2260 2273 22.75 22.45 
化 学 上 HE 
22.87 2280 2372 2360 23.06 23.39 24.32 23.39 
= 
~ FE 
化 借入 个 于 的 区 而 关 驻 部 和 26.53 
型 ( 修 偏 ) 
PM 2.5 
AirNet6 10.07 11.41 1031 1200 1204 11.66 11.66 11.31 
Prophet 12.82 13.48 13.80 14.09 1431 14.51 14.75 13.97 
et 1423 1432 1430 1439 1443 14.40 14.32 14.34 
化 学 FE 
化 守 模 99 人 86 全 0 14 和 9 儿科 体 的 14.46 
型 
化 学 上 HE 
化 守 异 ，。 和 人 6 新 林 驻 骆 闪 时 他 的 让 16.91 
型 ( 修 偏 ) 
(3) 相关 系数 (Correlation coefficient, r) 
表 4 相关 系数 结果 比较 
‘Table 3. Compatison of cottelation coefficient results 
因子 模型 Dayl Day2 Day3 Day4 Day5 Day6 Day7 平均 
O3 
Mt Oy We 0.74 
prophet 066 061 059 057 055 054 0.53 0.58 
a 042 040 040 041 04 041 0.41 0.41 
化 学 模 044 045 043 042 045 048 0.45 0.45 
型 
化 学 模 044 045 043 042 045 048 0.45 0.45 


型 ( 修 


和 


NO 2 


CO 


SO 2 


PM 10 


PM 2.5 


AirNet6 
Prophet 


lstm 

化 学 模 
型 

化 学 模 

型 ( 修 偏 ) 


AirNet6 
Prophet 


lstm 

化 学 模 
型 

化 学 模 

型 ( 修 偏 ) 


AirNet6 
Prophet 


lstm 

化 学 模 
型 

化 学 模 

型 ( 修 偏 ) 


AirNet6 
Prophet 


lstm 
化 学 模 
型 
化 学 模 
型 ( 修 偏 ) 


AirNet6 


Prophet 


0.21 


0.21 


0.49 


0.07 


0.60 


0.28 


0.32 


0.32 


0.15 


0.27 


0.03 


0.07 


0.07 


0.16 


0.17 


0.06 


0.00 


0.00 


0.03 


0.43 


0.13 


0.17 


0.17 


0.61 


0.40 


0.30 


0.30 


0.00 


0.30 
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0.07 


0.59 


0.27 


0.30 


0.30 


0.13 


0.25 


0.03 


0.05 


0.05 


0.13 


0.10 


0.06 


-0.01 


-0.01 


0.53 


0.35 


0.09 


0.10 


0.10 


0.51 


0.32 


0.67 


0.59 


0.27 


0.30 


0.30 


0.13 


0.24 


0.03 


0.06 


0.06 


0.13 


0.16 


0.06 


-0.01 


-0.01 


0.53 


0.33 


0.07 


0.12 


0.12 


0.50 


0.29 


0.32 


0.32 


0.28 


0.65 


0.57 


0.27 


0.32 


0.32 


0.13 


0.22 


0.03 


0.08 


0.08 


0.16 


0.16 


0.06 


-0.01 


-0.01 


0.58 


0.29 


0.04 


0.16 


0.16 


0.54 


0.25 


0.67 


0.59 


0.26 


0.32 


0.32 


0.16 


0.25 


0.03 


0.07 


0.07 


0.16 


0.17 


0.06 


-0.01 


-0.01 


0.59 


0.37 


0.09 


0.14 


0.14 


0.58 


0.34 


根据 实验 的 结 细 


lstm 
化 学 模 
型 

化 学 模 
型 ( 修 偏 ) 


0.08 0.06 0.06 


0.20 0.18 0.08 


0.20 0.18 0.08 


这 四 个 的 准 
很 接近 且 明 显 人 


模型 训练 完 后 通常 可 使 用 一 个 季度 到 一 年 ， 
E 2022 年 7 月 1 日 的 数据 ) 的 规律 ， 


是 2021 年 


可 知 ，AirNet6 在 预测 六 个 监测 
确 率 都 明显 优 于 其 他 模型 ,而 一 氧化 碳 、 二 氧化 硫 这 本 
于 其 他 模型 。 


~ 


0.04 0.03 
0.11 0.13 
0.11 0.13 


0.16 0.19 0.15 


月 1 日 3 


的 预测 准确 


2 


| 
DANo 


模型 在 常规 人 


的 资源 非常 小 ， 在 
钟 内 就 可 完成 6 个 医 
于 重 污染 天 


率 会 下 降 , 届时 需要 重新 使 用 新 的 训 


运行 时 ,不 需要 进行 训 


气 的 应 对 


O 


4. 资源 消耗 比较 : 


因子 中 , 臭氧 、 二 氧化 氮 、PM10、PM2.5 
个 因子 的 准确 率 与 Prophet 


天 为 模型 只 是 捕捉 了 训 绕 数 据 (本 文 使 用 的 
当 内 、 外 环境 因素 有 变化 后 ， 模型 


| 练 数据 重新 训练 模型 ， 以 获得 更 匹配 的 预测 


台 普 通 配 置 的 PC (CPU AMD Ryzen 7 1700， 


和 东 ， 只 需要 使 用 训练 好 的 模型 进行 推演 ,因此 消耗 


GPU nvidia 970) ,在 2 分 


子 168 小 时 的 预测 ， 可 以 在 生产 中 实现 密度 为 每 小 时 一 次 的 预测 ， 有 助 


有 
训练 Wa 肖 规 运 帅 nd ] 硬件 源 数据 需求 
耗 时 需求 行 耗 时 需求 
AirNet6 2 天 3080GPU 2 分 普通 PC 历史 数据 、 天 气 预 测 
Prophet 无 无 6 小 时 普通 PC 历史 数据 
LST™ 外 天 3080GPU 1 分 多 普通 PC 历史 数据 
化 学 模型 无 无 6 小 时 服务 右 集 群 历史 数据 、 天 和 气 预 测 、 源 清单 


表 5 资源 消耗 比较 


Table 3. Compatison of Resource consumption 


5。 结论 和 未 来 工作 


在 本 文中 , 笔 老 
随时 间 变 化 及 随 天 气 和 社会 活动 的 规律 ,快速 而 准确 的 预测 未 来 的 空气 质量 数据 。 实 验 表 明 ， 


总 结 了 一 种 新 的 深度 


在 真实 的 ) 


东 省 近年 的 国 控 数 据 集 上 ， 新 


监测 ) 。 


党 理 是 十 分 有 用 的 。 


未 来 , 笔者 会 继续 


学 习 模型 的 研究 与 实践 


的 模型 


, 捕捉 一 片区 域 的 空气 质量 


J] 
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天 化 过 代 模型 ,提高 它 的 准确 性 和 适用 范 


天 于 其 他 方法 , 这 对 于 实施 更 加 精细 的 环境 


半 〈 如 河流 水 质 监 测 、 噪 声 
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